Optimisation de requêtes sur des données massives dans un environnement distribué. (Optimization of queries over large data in a distributed environment)
نویسنده
چکیده
La matérialisation (ou pré-calcul de résultats) est une des techniques permettant d'optimiser les requêtes. Le problème qui se pose alors peut être décrit comme suit: étant donné un ensemble de requêtes cibles (workload), quelles sont les "meilleures" parties de la base de données qu'on doit matérialiser afin d'optimiser le workload ? La définition de "meilleure" peut prendre plusieurs dimensions selon la fonction de coût que l'on veut minimiser.
منابع مشابه
Towards service-oriented continuous queries in pervasive systems
Pervasive information systems give an overview of what digital environments should look like in the future. From a data-centric point of view, traditional databases have to be used alongside with non-conventional data sources like data streams, services and events. In this paper, we tackle the definition of continuous queries combining standard relations, data streams and services in a declarat...
متن کاملA Constraint Satisfaction based Approach to View Selection in a Distributed Context
Les vues matérialisées sont utilisées dans les systèmes de gestion de bases de données commercialisés pour accélérer le temps de traitement des requêtes. Cette technique est aussi très utile dans les entrepôts de données pour améliorer les performances des requêtes décisionnelles. Cependant, le problème de sélection de vues a été étudié surtout dans un contexte centralisé. Dans cet article, nou...
متن کاملTraitement continu des requêtes dépendantes de la localisation dans les environnements intérieurs
This paper develops a data and knowledge representation of an indoor environment that takes into account user-centred contextual dimensions and mobile data management issues. We introduce a hierarchical, context-dependent, and feature-based indoor spatial data model in which location information is represented at different levels of abstraction. A query language supporting continuous location-d...
متن کاملClassification non supervisée des données hétérogènes à large échelle
Résumé. Quand il sera question de classifier des données massives, le temps de réponse, l’accès disque et la qualité des classes formées deviennent des enjeux majeurs pour les entreprises. C’est dans ce cadre que nous avons été amenés à définir un cadre de classification non supervisée des données hétérogènes à large échelle qui contribue à la résolution de ces enjeux. Le cadre proposé s’articu...
متن کاملOptimization of Range Queries through two-level B(UB) Tree Indexing
Résumé— Cet article traite le problème de l’optimisation des requêtes par intervalles, qui jouent un rôle important dans le domaine des bases de données multidimensionnelles (entrepôts de données, Systèmes d’information Géographique). Les techniques classiques teltes que les Grid Files, les R-trees, les R*-trees, ... reposent sur une partition de l’espace de données selon plusieurs axes, ce qui...
متن کامل